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I DB seq length: 0 
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Post-processing: Minimum Match 0% 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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15-MAY-2002 (first entry) 

Colon adenocarcinoma related gene sequence SEQ ID NO: 1061. 

Human; cancer; colon; breast; ovary; oesophagus; kidney; thyroid; 
stomach; lung; prostate; pancreas; carcinoma; antitumour; cancerous; 
cytostatic; gene therapy; antineoplastic; Wilm's tumour; adenocarcinoma; 
gene; ds . 

Homo sapiens . 

WO200194629-A2. 

13-DEC-2001. 

30-MAY-2001; 2001WO-US010838 . 



05-JUN-2000; 
05-JUN-2000; 
18-SEP-2000; 
18-SEP-2000; 
20-SEP-2000; 
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25-SEP-2000; 
25-SEP-2000; 
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(AVAL-) AVALON PHARM. 



Young PE, Augustus M, 
Soppet DR, Weaver Z; 



WPI; 2002-188264/24. 
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Carter KC, Ebner 



Endress G, Horrigan S; 
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DR PC_ENCPRO:NCBI; gi36553. 
XX 

PT Screening for anti-neoplastic agent involves exposing cells to a chemical 

PT agent to be tested for anti-neoplastic activity, and determining a change 

PT in expression of a gene of a signature gene set. 

XX 

PS Claim 1; SEQ ID NO 1061; 44pp; English. 

XX 

CC The present invention describes a method (Ml) for screening for an anti- 

CC neoplastic agent. The method involves exposing cells to a chemical agent 

CC to be tested for anti-neoplastic activity, determining a change in 

CC expression of at least one gene (I) of a signature gene set, where (I) 

CC comprises a sequence (S) selected from 8447 sequences (given in ABL61664 

CC to ABL70110), or is at least 95% identical to (S), where a change in 

CC expression is indicative of anti-neoplastic activity. (I) has cytostatic 

CC activity and can be used in gene therapy. Ml can be used for screening an 

CC anti-neoplastic agent, and can be used for producing a product which is 

CC the data collected with respect to the anti-neoplastic agent as a result 

CC of Ml, and the data is sufficient to convey the chemical structure and/or 

CC properties of the agent. Ml can be used in the treatment of cancer such 

CC as colon, breast, stomach, lung, thyroid, oesophageal, ovarian, kidney, 

CC prostate or pancreatic cancer, adenocarcinoma, carcinoma, clear cell 

CC cancer, infiltrating ductal cancer, infiltrating lobular cancer, squamous 

CC cell carcinoma, neuroendocrine carcinoma, papillary carcinoma and Wilm's 

CC tumour 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2/9V; DB 6; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 6 0 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 



61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 



121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 



Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 



Qy 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I 
301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 36 0 



Qy 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 



Qy 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 
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481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATC7VAGCGACCCATGA 540 

541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 120 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 120 0 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 132 0 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

14 41 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 
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1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 186 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 186 0 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTi:-;i:-;A';vvv_;,-V'CTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 216 0 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 215 0 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 40 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 40 0 

2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 45 0 

2 461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 



2 461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 252 0 



Qy 



2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 




Db 



2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 



Db 



Qy 




Qy 



26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 70 0 




Db 



2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 



Qy 




Db 



Qy 



2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 




Db 



2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 2 
ABV94033 

ID ABV94033 standard; cDNA; 2797 BP. 
XX 

AC ABV9 4033; 
XX 

DT ll-JUN-2007 (revised) 

DT 08-JAN-2003 (first entry) 

XX 

DE Breast carcinoma related nucleotide sequence SEQ ID NO: 24. 

XX 

KW Human; breast carcinoma; cancer; tumour; cytostatic; anti-tumour; gene; 

KW ss. 

XX 

OS Homo sapiens . 
XX 

PN WO200246467-A2. 
XX 

PD 13-JUN-2002. 
XX 

PF 07-DEC-2001; 200 1WO-IB0028 1 1 . 
XX 

PR 08-DEC-2000; 200 OUS-02 5 409 OP . 

PR 07-DEC-2001; 200 1US-00007926 . 
XX 

PA (IPSO-) IPSOGEN. 
XX 

PI Bertucci F, Houlgatte R, Birnbaum D, Nguyen C, Viens P, Fert V; 
XX 

DR WPI; 2002-619023/66. 

DR PC:NCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

PT Novel polynucleotide library useful in molecular characterization of a 

PT carcinoma, comprising a pool of polynucleotide sequences or its 

PT subsequences which are either underexpressed or overexpressed in tumor 

PT cells. 

XX 

PS Claim 1; Page 124-125; 401pp; English. 

XX 

CC The present invention describes a polynucleotide library (I) useful in 

CC the molecular characterisation of a carcinoma, comprising a pool of 

CC polynucleotides or its subsequences which are either underexpressed or 

CC overexpressed in tumour cells, and correspond to any of the 
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CC polynucleotide sequences chosen from the 468 sequences qiven in ABV94010 

CC to ABV94477. Also described: (1) a polynucleotide array (II) useful for 

CC the prognosis or diagnostic of tumour, comprising (I); and (2) detecting 

CC (Ml) differentially expressed polynucleotide sequences which are 

CC correlated with a cancer, involves obtaining a polynucleotide sample from 

CC a patient, and reacting the polynucleotide sample obtained with a probe 

CC immobilised on a solid support, where the probe comprises any combination 

CC of the polynucleotide sequences of (I) or its expression products encoded 

CC by polynucleotide sequences of (I), and detecting the reaction product. 

CC (I) have cytostatic activities and can be used as anti-tumour agents. (I) 

CC is useful in molecular characterisation of a carcinoma. (I) and (II) are 

CC useful for the prognosis or diagnostic of tumour, in differentiating a 

CC normal cell from a cancer cell, detecting a hormone sensitive tumour 

CC cell, differentiating a tumour with lymph nodes from a tumour without 

CC lymph nodes, differentiating antracycline-sensitive tumours from 

CC antracycline-insensitive tumours, and classifying good and poor prognosis 

CC primary breast tumours. (I) is useful for large-scale molecular 

CC characterisation of breast cancer that help in prediction, prognosis and 

CC cancer treatment, and for detecting differentially expressed genes that 

CC correlated with a cancer 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2797; DB 6; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

Qy 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

Qy 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

Qy 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

Qy 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

Qy 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

Qy 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

Qy 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 
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601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
8 41 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 108 0 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 120 0 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

14 41 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 
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1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 186 0 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 204 0 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 228 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 40 0 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 

2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 
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2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 

26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 70 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 70 0 

2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 3 
ABX76311 

ID ABX76311 Standard; DNA; 



ll-JUN-2007 (revised) 
02-APR-2003 (first entry) 



DE Lung cancer-associated polynucleotide #175. 
XX 

KW Lung cancer-associated polynucleotide; gene; ds; cytostatic; emphysema; 

KW antiinflammatory; antiasthmatic; non-small cell lung cancer; atelectasis; 

KW small cell lung cancer; benign lesion; precancerous lesion; bronchitis; 

KW chronic obstructive pulmonary disease; hypersensitivity pneumonitis; 

KW interstitial pulmonary fibrosis; fibrosis; asthma; bronchiectasis. 
XX 

OS Unidentified. 

XX 

PN WO200286443-A2. 
XX 

PD 31-OCT-2002. 
XX 

PF 18-APR-2002; 200 2WO-US0 1 2 4 76 . 
XX 

PR 18-APR-2001; 200 lUS-02 8 4 7 7 OP . 

PR lO-MAY-2001; 200 lUS-02 90 49 2P . 

PR 09-NOV-2001; 200 lUS-03392 4 5P . 

PR 13-NOV-2001; 200 lUS-035066 6P . 

PR 29-NOV-2001; 2001US-0334370P. 

PR 12-APR-2002; 2002US-0372246P. 
XX 

PA (EOSB-) EOS BIOTECHNOLOGY INC. 



WPI; 2003-093161/08. 
P-PSDB; ABU56582. 
PC:NCBI; gi36552. 

Detecting a lung cancer-associated transcript in a cell from a patient 
for treating lung cancer, by contacting a biological sample from the 
patient with a polynucleotide that exhibits increased or decreased 
expression in lung cancer. 

Claim 22; Page 322-323; 453pp; English. 

The invention relates to a method for detecting a lung cancer-associated 
transcript in a cell from a patient, comprising contacting a biological 



)://es/ScoreAccessWeb/GetItem.action?AppId=10564585&seqId=09323b67808286b9&ItemName=2008... 7/16/08 



SCORE Search Results Details for Application 10564585 and Search Resuh 20080623_150908_us-10... Page 12 of 61 



CC sample from the patient with a polynucleotide that selectively hybridises 

CC to a sequence that is at least 80 % identical to a gene that exhibits 

CC increased or decreased expression in lung cancer samples. Lung cancer- 

CC associated polynucleotides and polypeptides are used for identifying a 

CC compound that modulates a lung cancer-associated polypeptide, for 

CC inhibiting proliferation of a lung cancer-associated cell to treat lung 

CC cancer in a patient and for treating a mammal having lung cancer by 

CC administering a modulatory compound identified. The methods are useful 

CC for treating lung cancer, such as small cell lung cancer, non-small cell 

CC lung cancer or other benign or precancerous lesions, e.g. atelectasis, 

CC emphysema, bronchitis, chronic obstructive pulmonary disease, fibrosis, 

CC hypersensitivity pneumonitis, interstitial pulmonary fibrosis, asthma and 

CC bronchiectasis. The genes, polynucleotides and polypeptides are useful 

CC for diagnostic purposes and as targets for screening for therapeutic 

CC compounds that modulate lung cancer, such as antibodies. Sequences 

CC ABX76124-ABX76474 represent lung cancer-associated polynucleotides of the 

CC invention 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2797; DB 8; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 



61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 



Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 



Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 



241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 



Qy 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 



421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 



481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 



541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 
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601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 6 50 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

8 4 1 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 132 0 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 16 2 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 
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1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 198 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 228 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 228 0 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 23 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 

2 461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 252 0 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 2640 

Qy 2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

Qy 2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

Qy 2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 4 
ADB72273 

ID ADB72273 Standard; mRNA; 2797 BP. 

XX 

AC ADB72273; 

XX 

DT ll-JUN-2007 (revised) 

DT 04-DEC-2003 (first entry) 

XX 

DE Human SOX 4 mRNA. 
XX 

KW human; ss; cytostatic; gene therapy; vaccine; carcinoma; lymphomas; 

KW cancer; neoplasm; adenocarcinoma; sarcoma. 

XX 

OS Homo sapiens. 
XX 

PN WO2003008583-A2. 
XX 

PD 30-JAN-2003. 
XX 

PF 26-DEC-2001; 2001WO-US051291 . 
XX 

PR 02-MAR-2001; 2001US-00798586 . 

PR 23-OCT-2001; 2001US-00004113 . 

PR 08-NOV-2001; 2001US-00052482 . 

PR 30-NOV-2001; 200 lUS-00997722 . 

PR 20-DEC-2001; 2001US-00034650 . 
XX 

PA (SAGR-) SAGRES DISCOVERY. 
XX 

PI Morris DW, Engelhard EK; 
XX 

DR WPI; 2003-239337/23. 

DR PC:NCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

PT New recombinant nucleic acid, useful for treating carcinomas, lymphomas, 

PT cancers, neoplasm, adenocarcinoma, or sarcomas. 

XX 

PS Claim 1; SEQ ID NO 101; 2304pp; English. 

XX 

CC The invention relates to a novel recombinant nucleic acid comprising a 

CC nucleotide sequence selected from any of the 660 sequences fully defined 

CC in the specification. A polynucleotide of the invention has cytostatic 

CC activity, and may have a use in gene therapy, or in a vaccine. The 

CC recombinant nucleic acids and polypeptides are useful for treating 

CC carcinomas, e.g. lymphomas, cancers, neoplasm, adenocarcinoma, and 

CC sarcomas. The present sequence represents a human mRNA of the invention. 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 
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SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2797; DB 8; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

Qy 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

Qy 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

Qy 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

Qy 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

Qy 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

Qy 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

Qy 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

Qy 601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

Qy 661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

Qy 721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

Qy 781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

Qy 841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

Qy 901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 
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961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 102 0 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 125 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 40 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 185 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 
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1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 1 1 I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 400 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 400 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 46 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 

2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 25 4 0 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 4 0 

2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 5 
ADA02535 

ID ADA02535 standard; cDNA; 2797 BP. 

XX 

AC ADA02535; 

XX 
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DT ll-JUN-2007 (revised) 

DT 06-NOV-2003 (first entry) 

XX 

DE Human S0X4 carcinoma associated cDNA, SEQ ID NO: 1053. 

XX 

KW Human; carcinoma associated; oncogene; carcinoma; cancer; breast; 

KW prostate; lymphoma; leukaemia; cytostatic; gene therapy; drug screening; 

KW gene; ss. 

XX 

OS Homo sapiens . 

XX 

PN WO2003057146-A2. 
XX 

PD 17-JUL-2003. 

XX 

PF 26-DEC-2002; 2002WO-US041414 . 
XX 

PR 26-DEC-2001; 2001US-00035832 . 

XX 

PA (SAGR-) SAGRES DISCOVERY. 

XX 

PI Morris DW; 
XX 

OR WPI; 2003-587058/55. 

OR PC:NCBI; gi36552. 

OR PC_ENCPRO:NCBI; gi36553. 

XX 

PT New recombinant nucleic acid encoding carcinoma associated protein, 

PT useful for preparing compositions for treating carcinomas. 

XX 

PS Claim 1; SEQ ID NO 1053; 245pp; English. 
XX 

CC The invention relates to recombinant carcinoma associated (CA) nucleic 

CC acid sequences from mouse and human (ADA01482-ADA03094 ) , and to 

CC recombinant carcinoma associated proteins (CAP) encoded by them. The 

CC invention also encompasses expression vectors and host cells comprising a 

CC CA nucleic acid, a polypeptide (especially an antibody) that specifically 

CC binds to the protein, and a biochip comprising CA nucleic acid or 

CC fragments thereof. The sequences of the invention were identified using 

CC oncogenic retroviruses, which insert into the genome of the host organism 

CC at random. Many of these do not carry transduced host oncogenes or 

CC pathogenic trans-acting viral genes, meaning that cancer incidence is a 

CC direct consequence of the effects of proviral integration into host 

CC protooncogenes . The CA nucleic acid sequences can be used to diagnose 

CC carcinoma (especially breast cancer, prostate cancer, lymphoma or 

CC leukaemia) or a propensity to carcinoma by determination of the sequence 

CC of a CA gene, or by determination of CA gene expression in particular 

CC tissues. CA nucleic acids, proteins and antibodies are also useful as 

CC therapeutic agents and in screening and evaluating drug candidates. The 

CC present sequence represents a specifically claimed human CA nucleic acid 

CC sequence of the invention. Note: The complete sequence data for this 

CC patent did not form part of the printed specification, but was obtained 

CC in electronic format directly from WIPO at 

CC ftp . wipo . int /pub/published_j5ct_sequences . 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2797; DB 9; Length 2797; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 



)://es/ScoreAccessWeb/GetItem.action?AppId=10564585&seqId=09323b67808286b9&ItemName=2008... 7/16/08 



SCORE Search Results Details for Application 10564585 and Search Result 20080623_150908_us-10... Page 20 of 61 



61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

5 41 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 950 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1021 GCGGCGGCGGGAAAGC AGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 108 0 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 120 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 120 0 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

14 41 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
14 41 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 20 4 0 

20 41 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 
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2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 216 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 216 0 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 400 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 246 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 

2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I 
2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 2640 

26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 70 0 

2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 6 

ADH28813 

ID ADH28813 standard; DNA; 2797 BP. 

XX 

AC ADH28813; 
XX 

DT ll-JUN-2007 (revised) 

DT ll-MAR-2004 (first entry) 

XX 

DE Human chronic myelogenous leukaemia (CML) gene marker #81. 

XX 

KW ds; chronic phase chronic myelogenous leukaemia; CP-CML; 

KW blast crisis CML; BC-CML; human; chronic myelogenous leukaemia; 

KW gene marker. 

XX 
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OS Homo sapiens . 
XX 

PN US2003104426-A1. 

XX 

PD 05-JUN-2003. 

XX 

PF 14-JUN-2002; 2002US-00171581 . 

XX 

PR 18-JUN-2001; 200 lUS-029891 4P . 

XX 

PA (LINS/) LINSLEY P S. 

PA (MAOM/) MAO M. 

PA (DAIH/) DAI H. 

PA (HEYY/) HE Y. 

PA (RADI/) RADICH J P. 

XX 

PI Linsley PS, Mao M, Dai H, He Y, Radich JP; 

XX 

DR WPI; 2003-787046/74. 

DR PC:NCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

PT Classifying cell sample as chronic phase chronic myelogenous leukemia or 

PT blast crisis chronic myelogenous leukemia by detecting difference in 

PT expression of genes corresponding to the markers such as X15415, U89436. 
XX 

PS Disclosure; SEQ ID NO 81; 31pp; English. 
XX 

CC The invention relates to a method of classifying a cell sample as chronic 

CC phase chronic myelogenous leukaemia (CP-CML) or blast crisis CML (BC- 

CC CML) . The method is useful for classifying a sample as CP-CML or BC-CML. 

CC The present sequence represents a human chronic myelogenous leukaemia 

CC (CML) gene marker used to distinguish blast crisis CML from chronic phase 

CC CML . 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2797; DB 10; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

Qy 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 



Qy 



181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 




Db 



181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 



Qy 



241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 



Db 



Qy 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 36 0 




Db 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 
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361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 102 0 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



http://es/ScoreAccessWeb/GetItem.action?AppId=10564585&seqId=09323b67808286b9&ItemName=2008... 7/16/08 



SCORE Search Results Details for Application 10564585 and Search Resuh 20080623_150908_us-10... Page 25 of 61 



1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 14 40 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 40 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1/41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 20 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 20 4 0 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 
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2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 246 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 46 0 

2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 2640 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 

26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 700 

2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 
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DT 18-NOV-2004 (first entry) 

XX 
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KW Tumour-associated antigenic target; TAT; human; overexpression; cancer; 
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XX 
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XX 
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XX 
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DR PC:NCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

FT New tumor-associated antigenic target polypeptides and nucleic acids, 

PT useful in preparing a medicament for treating or detecting a 

FT proliferative disorder, e.g. breast, lung, colorectal, ovarian or 

PT prostate cancer or tumor. 

XX 

PS Claim 1; SEQ ID NO 2032; 7273pp; English. 
XX 

CC The invention relates to human tumour-associated antigenic target (TAT) 

CC polypeptides, and their related nucleic acids. The TAT polypeptides are 

CC overexpressed in cancer tissues compared to normal tissues, and may thus 

CC serve as effective targets for the diagnosis and treatment of cancer in 

CC mammals. The invention also relates to nucleic acid and polypeptide 

CC sequences at least 80% identical to the TAT nucleic acids and 

CC polypeptides; expression vectors and host cells comprising a TAT nucleic 

CC acid; an antibody specific for a TAT polypeptide; a peptide or organic 

CC molecule which binds to a TAT polypeptide; fusion proteins comprising a 

CC TAT polypeptide; and methods and compositions for the treatment or 

CC diagnosis of cancer in mammals. TAT polypeptides, nucleic acids, 

CC antibodies, antagonists, binding molecules and compositions are useful 

CC for diagnosing or treating a cell proliferative disorder associated with 

CC increased TAT expression, particularly cancers such as breast cancer, 

CC colorectal cancer, lung cancer, ovarian cancer, liver cancer, bladder 

CC cancer, pancreatic cancer, cervical cancer, cancers of the central 

CC nervous system, melanoma and leukaemia. TAT nucleic acids may further be 

CC used as hybridisation probes, in chromosome and gene mapping, in 

CC chromosome identification and in gene therapy. The present sequence 

CC represents a TAT nucleic acid of the invention 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2797; DB 12; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 



61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 1 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 



Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 



Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 



Qy 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 



Qy 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 



361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 
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421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

5 41 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I M I M I I I I I I I I I I I I I I I I I I I I I I I 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 950 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 132 0 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 14 40 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 4 0 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 186 0 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 228 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 228 0 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 23 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 40 0 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 246 0 
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GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 




Qy 


2461 


AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 


2520 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 1 1 1 1 1 1 1 1 1 




Db 


2461 


AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 


2520 


Qy 


2521 


ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 


2580 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2521 


ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 


2580 


Qy 


2581 


CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 


2640 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2581 


CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 


2640 


Qy 


2641 


CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 


2700 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2641 


CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 


2700 


Qy 


2701 


GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 


2760 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2701 


GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 


2760 


Qy 


2761 


GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 








1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2761 


GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 





RESULT 8 
ADW47984 



ID ADW47984 standard; cDNA; 2797 BP. 

XX 

AC ADW47984; 
XX 

DT ll-JUN-2007 (revised) 

DT 07-APR-2005 (first entry) 

XX 

DE Human sex determining region Y box 4 (S0X4) nucleic acid. 
XX 

KW Sex determining region Y box 4; S0X4; prostate tumor; cytostatic; 

KW gene therapy; gene; ss. 

XX 

OS Homo sapiens. 

XX 

FH Key Location/Qualifiers 

FT CDS 351. .1775 

FT /*tag= a 

FT /product= "Human S0X4" 



XX 

FN WO2005007830-A2. 
XX 

PD 27-JAN-2005. 

XX 

PF 14-JUL-2004; 2004WO-US022850 . 

XX 

PR 14-JUL-2003; 2003US-0487553P . 

XX 



PA (MAYO-) MAYO FOUND MEDICAL EDUCATION & RES. 

XX 

PI Vanaja DK, Young CYF; 
XX 

DR WPI; 2005-102097/11. 

DR P-PSDB; ADW47985. 

DR PC:NCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

PT Detecting/detecting and distinguishing between or among prostate cell 
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PT proliferative disorders or their stages in a subject, useful for treating 

PT prostate cancer, by determining gene expression level of e.g. supervillin 

PT (SVIL) . 

XX 

PS Claim 1; SEQ ID NO 43; 178pp; English. 

XX 

CC The invention provides novel methods and compositions for the diagnosis, 

CC staging and prognosis of prostate cancer based on DNA methylation and/or 

CC modulation of gene expression, including transcriptional silencing. Gene 

CC expression profiling in benign and untreated human prostate cancer 

CC tissues identified diagnostic and/or prognostic nucleic acid and protein 

CC markers. These included: the differentially (relative to benign tissue) 

CC down-regulated seguences corresponding to zinc finger protein 185 

CC (ZNF185), prostate secretory protein (PSP94), bulbous pemphigoid antigen 

CC (BPAG), supervillin (SVIL), proline rich membrane anchor 1 (PRIMAl), 

CC TU3A, FLJ14084, KIAA 1210, Sorbin and SH3 domain containing 1 (SORBSl), 

CC and C21orf63; and the differentially up-regulated sequences MARCKS-like 

CC protein (MLP), SRY (sex determining region Y)-box 4 (80X4), fatty acid 

CC binding protein 5 (FABP5), I4AL2 and Erg isoform 2 (erg-2). Also provided 

CC are nucleic acids, nucleic acid arrays and kits useful for detecting, or 

CC for detecting and differentiating between or among prostate cell 

CC proliferative disorders and/or tumor progression. The present sequence is 

CC that of a polynucleotide encoding human S0X4, a high mobility group box 4 

CC transcription factor involved in the regulation of embryonic development 

CC and in the determination of cell fate. Increase of S0X4 levels indicates 

CC a role in development and/or progression of prostate cancer. 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2797; DB 16; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

Qy 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 



Db 




Db 



Qy 




Qy 



181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 




Db 



181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 



Qy 



241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 




Db 



241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 



Qy 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 35 0 




Db 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 



Qy 



361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 



Db 



Qy 



421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 




Db 



421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 
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481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

5 41 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5 41 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 8 1 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 114 0 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 14 40 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 155 0 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I M I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 192 0 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 216 0 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 215 0 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 23 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 23 4 0 

23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2 400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 45 0 

2 451 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 



http://es/ScoreAccessWeb/GetItem.action?AppId=10564585&seqId=09323b67808286b9&ItemName=2008... 7/16/08 



SCORE Search Results Details for Application 10564585 and Search Resuh 20080623_150908_us-10... Page 34 of 61 



2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 258 0 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 2640 

2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 9 
AEK50054 

ID AEK50054 standard; DNA; 2797 BP. 
XX 

AC AEK60054; 
XX 

DT ll-JUN-2007 (revised) 

DT 16-NOV-2006 (first entry) 

XX 

DE Human S0X4 mRNA sequence, SEQ ID NO: 41. 
XX 

KW Diagnostic; therapeutic; cancer; neoplasm; carcinoma; lymphoma; 

KW hematological disease; immune disorder; breast tumor; endocrine disease; 

KW gynecology and obstetrics; ds; S0X4. 

XX 

OS Homo sapiens. 
XX 

PN US2006204982-A1 . 
XX 

PD 14-SEP-2005. 
XX 

PF 12-JAN-2006; 2006US-00330726 . 
XX 

PR 22-DEC-2000; 2000US-00747377 . 

PR 02-MAR-2001; 2001US-00798586 . 

PR 08-NOV-2001; 2001US-00052482 . 
XX 

PA (MORR/) MORRIS D W. 

PA (ENGE/) ENGELHARD E K. 

XX 

PI Morris DW, Engelhard EK; 
XX 

DR WPI; 2006-688299/71. 

DR PCrNCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

PT Screening for anticancer activity comprises detecting a difference 

PT between the levels of an expression product of a cancer associated gene 

PT in a cell in the presence and absence of an anticancer drug candidate. 

XX 

PS Disclosure; SEQ ID NO 41; 28pp; English. 
XX 

CC The present invention relates to novel sequences for use in diagnosis and 
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CC treatment of carcinomas, especially lymphoma carcinomas. In addition, the 

CC present invention describes the use of novel compositions for use in 

CC screening methods. Disclosed is a method for screening for anticancer 

CC activity by detecting a difference between the levels of an expression 

CC product of a cancer associated (CA) gene in a cell in the presence and 

CC absence of an anticancer drug candidate. A difference of at least 50% in 

CC the levels of the expression product in the presence of the anticancer 

CC drug candidate compared to the levels of the expression product in the 

CC absence of the anticancer drug candidate indicates that the anticancer 

CC drug candidate has anticancer activity. The methods and compositions are 

CC useful for screening for anticancer activity and for diagnosing and 

CC treating cancer, specifically breast cancer. Sequences given in AEK60014- 

CC AEK6 0253 are that of CA nucleic acid sequences including genomic 

CC seguence, mRNA and coding sequence. Note: The sequence data for this 

CC patent did not form part of the printed specification but was obtained in 

CC electronic format directly from USPTO at seqdata.uspto.gov/sequence.html. 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2797; DB 19; Length 2797; 

Best Local Similarity 100.0%; Fred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

Qy 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 2 40 

Qy 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

Qy 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

Qy 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

Qy 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

Qy 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

Qy 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

Qy 601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 
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661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I j I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 114 0 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 1260 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 14 40 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 
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16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 2220 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 23 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 23 4 0 

2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2460 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 46 0 

2 461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 
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Qy 



26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 




Db 



26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 



Db 



Qy 




Qy 



2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 




Db 



2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 



RESULT 10 
AEM95802 

ID AEM95802 standard; cDNA; 2797 BP. 

XX 

AC AEM95802; 
XX 

DT ll-JUN-2007 (revised) 

DT 22-MAR-2007 (first entry) 

XX 

DE Human CML marker gene, SEQ ID NO: 81. 
XX 

KW ss; gene; chronic myelocytic leukemia; genetic marker; diagnostic; 

KW DNA microarray; gene expression. 

XX 

OS Homo sapiens . 
XX 

PN US2006292623-A1. 

XX 

PD 28-DEC-2006. 

XX 

PF 25-AUG-2006; 2006US-00510798 . 
XX 

PR 18-JUN-2001; 2001US-0298914P. 

PR 14-JUN-2002; 2002US-00171581 . 
XX 

PA (HUTC-) HUTCHINSON CANCER RES CENT FRED. 

PA (ROSE-) ROSETTA INPHARMATICS LLC. 

XX 

PI Linsley PS, Mao M, Dai H, He Y, Radich JP; 

XX 

DR WPI; 2007-173869/17. 

DR EMBL; X70683. 

DR PC:NCBI; gi36552. 

DR PC_ENCPRO:NCBI; gi36553. 

XX 

PT Classification of cell sample as chronic phase or blast crisis of chronic 

PT myeloid leukemia involves detecting a difference or similarity in 

PT expression by genes from sample corresponding to a set of specific 

PT markers, relative to control. 

XX 

PS Claim 5; SEQ ID NO 81; 28pp; English. 

XX 

CC The invention relates to classifying a cell sample as chronic phase 

CC chronic myeloid leukemia (CP-CML) or blast crisis chronic myeloid 

CC leukemia (BC-CML) by detecting a difference in the expression by the cell 

CC sample of a first set of several genes relative to a control. The first 

CC set of several genes consist of at least 5 genes corresponding to 366 

CC markers (SEQ ID Nos: 1 - 366, AEM95722-AEM96087 ) . The invention comprises 

CC a kit for determining the progression status of a tissue sample or a 

CC sample of bodily fluid from a human or an animal, comprising at least two 

CC microarrays, each comprising at least 20 of the 356 markers as given in 

CC the specification, and a computer system for determining the similarity 

CC of the level of nucleic acid derived from the markers in a sample to that 
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cc in the CP-CML template and the BC-CML template. The method involves 

CC computing the aggregate differences in expression of each marker between 

CC the sample and the CP-CML pool or the BC-CML pool, or determining the 

CC correlation of expression, calculated according to the eguation as given 

CC in the specification, of the markers in the sample to the expression in 

CC the CP-CML and BC-CML pools. The microarray for distinguishing CP-CML 

CC from BC-CML cell samples comprises a positionally-addressable array of 

CC polynucleotide probes bound to a support, the polynucleotide probes 

CC comprising a sequence complementary and hybridizable to a different gene 

CC corresponding to one of the markers. The method for classifying a sample 

CC as CP-CML or BC-CML involves labeling and detecting nucleic acids derived 

CC from a sample with a first fluorophore to obtain a first pool of 

CC f luorophore-labeled nucleic acids, labeling with a second fluorophore a 

CC first pool of nucleic acids derived from two or more CP-CML samples, and 

CC a second pool of nucleic acids derived from two or more BP-CML samples, 

CC contacting the first f luorophore-labeled nucleic acid and the first pool 

CC of second f luorophore-labeled nucleic acid with the first microarray 

CC under hybridization conditions, and contacting the first fluorophore- 

CC labeled nucleic acid and the second pool of second f luorophore-labeled 

CC nucleic acid with the second microarray under hybridization conditions. 

CC The similarity between the expression of the markers is calculated by 

CC determining a first sum of the differences of expression levels for each 

CC marker between the first f luorophore-labeled nucleic acid and the first 

CC pool of second f luorophore-labeled nucleic acid, and a second sum of the 

CC differences of expression levels for each marker between the first 

CC f luorophore-labeled nucleic acid and the second pool of second 

CC f luorophore-labeled nucleic acid, where if the first sum is greater than 

CC the second sum, the sample is classified as CP-CML, and if the second sum 

CC is greater than the first sum, the sample is classified as BC-CML. The 

CC method provides accurate determination of different phases (chronic phase 

CC or blast crisis) of chronic myeloid leukemia (CML), thereby allowing the 

CC determination of treatment options, prognosis and likelihood of 

CC therapeutic response. The present sequence is that of one of the human 

CC marker genes of the current invention. 

CC 

CC Revised record issued on ll-JUN-2007 : Enhanced with precomputed 

CC information from BOND. 

XX 

SQ Sequence 2797 BP; 547 A; 880 C; 931 G; 439 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2797; DB 22; Length 2797; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2797; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 60 



Qy 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 



Qy 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 



Qy 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 



Qy 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 



301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 
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361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 600 

601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 102 0 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 14 40 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 150 0 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

16 81 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 17 40 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

17 41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1/41 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 20 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 20 4 0 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



23 41 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 
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2401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 246 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 46 0 

2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 2640 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 26 40 

26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
26 41 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2 700 

2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2760 

2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 
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:C This invention relates to novel recombinant nucleic acids for use in 

:C diagnosis and treatment of cancer, especially carcinomas, as well as the 

;C use of compositions in screening methods. The compositions of the 

:C invention may have cytostatic activity whilst the disclosed seguences may 

:C be useful for gene therapy. The carcinoma associated nucleic acids and 

:C proteins are useful for diagnosing and treating carcinomas, for example 

:C lymphoma, breast cancer, prostate cancer or leukaemia, or for screening 

:C drug candidates or bioactive agents capable of binding to, or modulating 

:C the activity of, a carcinoma associated protein. The present sequence is 

:C a DNA sequence which represents the mRNA derived from the human S0X4 gene 

:C which is a carcinoma associated gene of the invention. 

:x 

;Q Sequence 2797 BP; 547 A; 881 C; 930 G; 439 T; 0 U; 0 Other; 

Query Match 99.9%; Score 2795.4; DB 9; Length 2797; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2796; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

)y 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 1 TTCCCCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAG 6 0 

)y 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 61 ACAGCAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTG 120 

)y 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 121 GGAACTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTT 180 

)y 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 181 TCTCTCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCG 240 

)y 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 241 CGTCTTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGG 300 

)y 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

)b 301 CGGCCGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGC 360 

)y 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

)b 361 AAACCAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCG 420 

)y 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 421 CCGGCCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCG 480 

)y 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 481 GCAAGGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGA 540 

)y 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 541 ACGCCTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACA 6 00 

)y 601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
)b 601 TGCACAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCG 660 

)y 661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

)b 661 ACAAGATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACC 720 

)y 721 CCGACTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCT 780 
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781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CGGCCGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGG 8 40 

841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 GCGGCCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTG 900 

901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CGAGTGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGG 960 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 CGGGCGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCG 1020 

1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCGGCGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGG 108 0 

1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCGCCGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGA 1140 

1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCCCAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCC 1200 

1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGGGCAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCA 126 0 

1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CGTCGTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCC 1320 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 TGTACGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCA 138 0 

1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GCGCCGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCC 1440 

1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGCGCGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGT 1500 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 CCCACTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACG 1560 

1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACCTGCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTT 1620 

16 21 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CGTCGTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACT 1680 

1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCGAGTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCG 1740 
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1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 180 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 AGTCCAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGC 1800 

1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CGGGGGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAA 186 0 

1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GAGTTTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGT 1920 

1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TCTCGTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCT 1980 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 2040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1981 TCCCGGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGAC 20 4 0 

2041 AGGGGCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGGGGCGACCTGTGATTGTTGTTATTCATGTTGTTGTTGATGGCAAAAAAAAAAAGCGAC 2100 

2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TTCGAGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGAC 2160 

2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TTGTCTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCC 222 0 

2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CTTCCTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGA 2280 

2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAACCCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGG 2340 

2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GGTGACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCAC 2400 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 46 0 

2 401 GCAGGCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGC 2 46 0 

2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCCGGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATG 2520 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 2580 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 ACCCGAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACA 258 0 

2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 25 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CGAACTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGG 2640 

2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CGGCGGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCA 2700 

2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 701 GACCCCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAG 2 76 0 
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Qy 2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 GGCGAGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 
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XX 

OS Homo sapiens . 
XX 

PN WO2003009814-A2. 
XX 

PD 06-FEB-2003. 

XX 

PF 25-JUL-2002; 2002WO-US023913 . 
XX 

PR 25-JUL-2001; 2001US-0307982P. 

PR 22-AUG-2001; 2001US-0314356P. 

PR 25-SEP-2001; 2001US-0325020P. 

PR 12-DEC-2001; 2001US-0341746P. 

PR 05-MAR-2002; 2002US-0362158P . 
XX 

PA (MILL-) MILLENNIUM PHARM INC. 
XX 

PI Schlegel R, Monahan JE, Endege WO, Gannavarapu M, Gorbatcheva B; 

PI Hoersh S, Kamatkar S, Wonsey AM, Glatt K, Zhao X, Anderson D; 

XX 

OR WPI; 2003-248033/24. 

XX 

PT New nucleic acid molecule, useful for diagnosing or treating prostate 

PT cancer. 

XX 

PS Claim 1; SEQ ID NO 380; 99pp; English. 

XX 

CC The invention relates to newly discovered cancer markers associated with 

CC the cancerous state of prostate cells. Also disclosed is a method of 

CC assessing whether a patient is afflicted with prostate cancer. The method 

CC of the invention involves assessing whether a patient is afflicted with 

CC prostate cancer by comparing the level of expression of a marker in a 

CC patient sample and the normal level of expression of the marker in a 

CC control non-prostate cancer sample, where a significant increase in the 

CC level of expression of the marker in the patient sample and the normal 

CC level indicates that the patient is afflicted with prostate cancer. 

CC Nucleic acids of the invention are useful for diagnosing or treating 

CC prostate cancer, and may be useful in gene therapy. Sequences given in 

CC ADB75177-ADB75631 represent marker cDNA and proteins. Note: The sequence 

CC data for this patent did not form part of the printed specification, but 

CC was obtained in electronic format directly from WIPO at 

CC ftp. wipo . int/pub/published_pct_sequences . 
XX 

SQ Sequence 3233 BP; 662 A; 979 C; 1043 G; 547 T; 0 U; 2 Other; 

Query Match 99.9%; Score 2793; DB 8; Length 3233; 
Best Local Similarity 100.0%; Fred. No. 0; 

Matches 2793; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 5 CCAGCATTCGAGAAACTCCTCTCTACTTTAGCACGGTCTCCAGACTCAGCCGAGAGACAG 6 4 
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6 5 CAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTGGGAA 124 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
501 CAAACTGCAGCGCGGTGAGAGAGCGAGAGAGAGGGAGAGAGAGACTCTCCAGCCTGGGAA 56 0 

125 CTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTTTCTC 18 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
561 CTATAACTCCTCTGCGAGAGGCGGAGAACTCCTTCCCCAAATCTTTTGGGGACTTTTCTC 620 

185 TCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCGCGTC 244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
621 TCTTTACCCACCTCCGCCCCTGCGAGGAGTTGAGGGGCCAGTTCGGCCGCCGCGCGCGTC 680 

245 TTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGGCGGC 304 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6 81 TTCCCGTTCGGCGTGTGCTTGGCCCGGGGAACCGGGAGGGCCCGGCGATCGCGCGGCGGC 7 40 

305 CGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGCAAAC 36 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
741 CGCCGCGAGGGTGTGAGCGCGCGTGGGCGCCCGCCGAGCCGAGGCCATGGTGCAGCAAAC 800 

365 CAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCGCCGG 424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
801 CAACAATGCCGAGAACACGGAAGCGCTGCTGGCCGGCGAGAGCTCGGACTCGGGCGCCGG 860 

425 CCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCGGCAA 484 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
861 CCTCGAGCTGGGAATCGCCTCCTCCCCCACGCCCGGCTCCACCGCCTCCACGGGCGGCAA 920 

485 GGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGAACGC 544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
921 GGCCGACGACCCGAGCTGGTGCAAGACCCCGAGTGGGCACATCAAGCGACCCATGAACGC 980 

5 45 CTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACATGCA 6 04 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
981 CTTCATGGTGTGGTCGCAGATCGAGCGGCGCAAGATCATGGAGCAGTCGCCCGACATGCA 1040 

605 CAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCGACAA 664 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

10 41 CAACGCCGAGATCTCCAAGCGGCTGGGCAAACGCTGGAAGCTGCTCAAAGACAGCGACAA 1100 

665 GATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACCCCGA 724 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1101 GATCCCTTTCATTCGAGAGGCGGAGCGGCTGCGCCTCAAGCACATGGCTGACTACCCCGA 1160 

725 CTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCTCGGC 784 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1161 CTACAAGTACCGGCCCAGGAAGAAGGTGAAGTCCGGCAACGCCAACTCCAGCTCCTCGGC 1220 

785 CGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGGGCGG 844 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1221 CGCCGCCTCCTCCAAGCCGGGGGAGAAGGGAGACAAGGTCGGTGGCAGTGGCGGGGGCGG 1280 

8 45 CCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTGCGAG 90 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1281 CCATGGGGGCGGCGGCGGCGGCGGGAGCAGCAACGCGGGGGGAGGAGGCGGCGGTGCGAG 13 4 0 

905 TGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGGCGGG 95 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1341 TGGCGGCGGCGCCAACTCCAAACCGGCGCAGAAAAAGAGCTGCGGCTCCAAAGTGGCGGG 1400 

965 CGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCGGCGG 102 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1401 CGGCGCGGGCGGTGGGGTTAGCAAACCGCACGCCAAGCTCATCCTGGCAGGCGGCGGCGG 146 0 
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1025 CGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGGCCGC 108 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1461 CGGCGGGAAAGCAGCGGCTGCCGCCGCCGCCTCCTTCGCCGCCGAACAGGCGGGGGCCGC 1520 

1085 CGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGACTCC 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1521 CGCCCTGCTGCCCCTGGGCGCCGCCGCCGACCACCACTCGCTGTACAAGGCGCGGACTCC 1580 

1145 CAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCCCGGG 120 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1581 CAGCGCCTCGGCCTCCGCCTCCTCGGCAGCCTCGGCCTCCGCAGCGCTCGCGGCCCCGGG 16 4 0 

1205 CAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCACGTC 126 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1641 CAAGCACCTGGCGGAGAAGAAGGTGAAGCGCGTCTACCTGTTCGGCGGCCTGGGCACGTC 1700 

1265 GTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCCTGTA 132 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1701 GTCGTCGCCCGTGGGCGGCGTGGGCGCGGGAGCCGACCCCAGCGACCCCCTGGGCCTGTA 176 0 

1325 CGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCAGCGC 138 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1761 CGAGGAGGAGGGCGCGGGCTGCTCGCCCGACGCGCCCAGCCTGAGCGGCCGCAGCAGCGC 1820 

1385 CGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCCTGCG 1444 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1821 CGCCTCGTCCCCCGCCGCCGGCCGCTCGCCCGCCGACCACCGCGGCTACGCCAGCCTGCG 1880 

14 45 CGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGTCCCA 150 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1881 CGCCGCCTCGCCCGCCCCGTCCAGCGCGCCCTCGCACGCGTCCTCCTCGGCCTCGTCCCA 1940 

1505 CTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACGACCT 156 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1941 CTCCTCCTCTTCCTCCTCCTCGGGCTCCTCGTCCTCCGACGACGAGTTCGAAGACGACCT 2000 

1565 GCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTTCGTC 162 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2001 GCTCGACCTGAACCCCAGCTCAAACTTTGAGAGCATGTCCCTGGGCAGCTTCAGTTCGTC 2060 

1625 GTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACTTCGA 1684 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2061 GTCGGCGCTCGACCGGGACCTGGATTTTAACTTCGAGCCCGGCTCCGGCTCGCACTTCGA 2120 

16 85 GTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCGAGTC 17 4 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2121 GTTCCCGGACTACTGCACGCCCGAGGTGAGCGAGATGATCTCGGGAGACTGGCTCGAGTC 2180 

1745 CAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGCCGGG 1804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2181 CAGCATCTCCAACCTGGTTTTCACCTACTGAAGGGCGCGCAGGCAGGGAGAAGGGCCGGG 2240 

1805 GGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAAGAGT 186 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2241 GGGGGTAGGAGAGGAGAAAAAAAAAGTGAAAAAAAGAAACGAAAAGGACAGACGAAGAGT 2300 

1865 TTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGTTCTC 1924 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2301 TTAAAGAGAAAAGGGAAAAAAGAAAGAAAAAGTAAGCAGGGCTCGTTCGCCCGCGTTCTC 2360 

1925 GTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCTTCCC 1984 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2361 GTCGTCGGATCAAGGAGCGCGGCGGCGTTTTGGACCCGCGCTCCCATCCCCCACCTTCCC 2420 

1985 GGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGACAGGG 20 4 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 421 GGGCCGGGGACCCACTCTGCCCAGCCGGAGGGACGCGGAGGAGGAAGAGGGTAGACAGGG 2480 
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2045 GCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAA.GCGACTTCG 2104 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2481 GCGACCTGTGATTGTTGTTATTGATGTTGTTGTTGATGGCAAAAAAAAAAAGCGACTTCG 2540 

2105 AGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGACTTGT 216 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 41 AGTTTGCTCCCCTTTGCTTGAAGAGACCCCCTCCCCCTTCCAACGAGCTTCCGGACTTGT 26 0 0 

2165 CTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCCCTTC 222 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2601 CTGCACCCCCAGCAAGAAGGCGAGTTAGTTTTCTAGAGACTTGAAGGAGTCTCCCCCTTC 2660 

2225 CTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGAGAAC 2284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2661 CTGCATCACCACCTTGGTTTTGTTTTATTTTGCTTCTTGGTCAAGAAAGGAGGGGAGAAC 2720 

2285 CCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGGGGTG 234 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2721 CCAGCGCACCCCTCCCCCCCTTTTTTTAAACGCGTGATGAAGACAGAAGGCTCCGGGGTG 2780 

23 45 ACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCACGCAG 2 40 4 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 781 ACGAATTTGGCCGATGGCAGATGTTTTGGGGGAACGCCGGGACTGAGAGACTCCACGCAG 284 0 

2405 GCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGCAGCC 246 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2841 GCGAATTCCCGTTTGGGGCCTTTTTTTCCTCCCTCTTTTCCCCTTGCCCCCTCTGCAGCC 2900 

2 465 GGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATGACCC 252 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 
2901 GGAGGAGGAGATGTTGAGGGGAGGAGGCCAGCCAGTGTGACCGGCGCTAGGAAATGACCC 296 0 

2525 GAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACACGAA 258 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2961 GAGAACCCCGTTGGAAGCGCAGCAGCGGGAGCTAGGGGCGGGGGCGGAGGAGGACACGAA 3020 

2585 CTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGGCGGC 264 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3021 CTGGAAGGGGGTTCACGGTCAAACTGAAATGGATTTGCACGTTGGGGAGCTGGCGGCGGC 3080 

26 45 GGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCAGACC 2 70 4 

3081 GGCTGCTGGGCCTCCGCCTTCTTTTCTACGTGAAATCAGTGAGGTGAGACTTCCCAGACC 3140 

2 705 CCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAGGGCG 2 76 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3141 CCGGAGGCGTGGAGGAGAGGAGACTGTTTGATGTGGTACAGGGGCAGTCAGTGGAGGGCG 3200 

2765 AGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 2797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3201 AGTGGTTTCGGAAAAAAAAAAAGAAAAAAAGGG 3233 



RESULT 13 
ABV22264 

ID ABV22264 standard; cDNA; 4467 BP. 
XX 

AC ABV22264; 

XX 

DT 13-SEP-2002 (first entry) 
XX 

DE Human prostate expression marker cDNA 22255. 

XX 

KW Human; prostate cancer; cytostatic; carcinogen; pharmacodyanamic marker; 

KW pharmacogenomic marker; gene; ss. 

XX 
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